Análisis Exploratorio de Datos¶


Calidad del agua del Rio Cauca¶


Descripción:
Contiene información de calidad de agua en el Rio Cauca, en 19 estaciones de muestreo.
Se miden aproximadamente 50 parámetros de calidad en el agua, entre Fisicoquímicos, Microbiológicos y Biológicos.
Contiene datos desde el año 1990.

Última Actualización
15 de julio de 2024

Datos suministrados por
Corporación Autónoma Regional del Valle del Cauca

Fuente:
Calidad del agua del Río Cauca


Información de los Datos:¶

Tamaño de muestra: 2254 datos
Número de Variables: 56

NOTA: Originalmente los datos vienen con un total de 56 variables pero para este análisis usaré las 23 variables más representativas.


Diccionario de Datos: (Las 23 con que se trabajará en el presente análisis)¶

Nombre de la Variable Descripción Tipo de Variable Escala de Medición Unidades de Medición
1 FECHA DE MUESTREO Fecha en la que se tomó la muestra de agua. Cualitativa Nominal Fecha
2 ESTACIONES Lugar donde se tomó la muestra. Cualitativa Nominal Nombre de la estación
3 pH Nivel de acidez o alcalinidad del agua. Cuantitativa Intervalar -
4 TEMPERATURA (°C) Temperatura del agua en el momento del muestreo. Cuantitativa Razón °C
5 COLOR (UPC) Medida de la coloración del agua en unidades de platino-cobalto. Cuantitativa Razón UPC
6 OXIGENO DISUELTO (mg O2/l) Cantidad de oxígeno presente en el agua. Cuantitativa Razón mg O₂/l
7 DEMANDA BIOQUIMICA DE OXIGENO (mg O2/l) Cantidad de oxígeno consumido por microorganismos. Cuantitativa Razón mg O₂/l
8 DEMANDA QUIMICA DE OXIGENO (mg O2/l) Cantidad de oxígeno requerido para oxidar la materia orgánica. Cuantitativa Razón mg O₂/l
9 TURBIEDAD (UNT) Medición de la pérdida de transparencia del agua. Cuantitativa Razón UNT
10 CONDUCTIVIDAD ELÉCTRICA (µS/cm) Capacidad del agua para conducir electricidad. Cuantitativa Razón µS/cm
11 SOLIDOS DISUELTOS (mg SD/l) Cantidad de materia disuelta en el agua. Cuantitativa Razón mg/l
12 NITRATOS (mg N-NO3/l) Concentración de nitratos en el agua. Cuantitativa Razón mg N-NO₃/l
13 FOSFATOS (mg PO4/l) Concentración de fosfatos en el agua. Cuantitativa Razón mg PO₄/l
14 CLORUROS (mg Cl/l) Concentración de cloruros en el agua. Cuantitativa Razón mg Cl/l
15 SULFATOS (mg SO4/l) Concentración de sulfatos en el agua. Cuantitativa Razón mg SO₄/l
16 PLOMO TOTAL (mg Pb/l) Cantidad de plomo presente en el agua. Cuantitativa Razón mg Pb/l
17 MERCURIO (µg Hg/l) Cantidad de mercurio presente en el agua. Cuantitativa Razón µg Hg/l
18 CROMO TOTAL (mg Cr/l) Cantidad de cromo presente en el agua. Cuantitativa Razón mg Cr/l
19 CADMIO TOTAL (mg Cd/l) Cantidad de cadmio presente en el agua. Cuantitativa Razón mg Cd/l
20 HIERRO TOTAL (mg Fe/l) Cantidad de hierro presente en el agua. Cuantitativa Razón mg Fe/l
21 COLIFORMES TOTALES (NMP/100 ml) Cantidad de bacterias coliformes totales. Cuantitativa Razón NMP/100 ml
22 COLIFORMES FECALES (NMP/100 ml) Cantidad de bacterias coliformes fecales. Cuantitativa Razón NMP/100 ml
23 CAUDAL (m3/s) Volumen de agua que pasa por un punto del río en un segundo. Cuantitativa Razón m³/s

Vistazo rápido de algunos de los datos:¶

FECHA DE MUESTREO ESTACIONES pH TEMPERATURA (°C) COLOR (UPC) OXIGENO DISUELTO (mg O2/l) DEMANDA BIOQUIMICA DE OXIGENO (mg O2/l) DEMANDA QUIMICA DE OXIGENO (mg O2/l) TURBIEDAD (UNT) CONDUCTIVIDAD ELÉCTRICA (µS/cm) ... CLORUROS (mg Cl/l) SULFATOS (mg SO4/l) PLOMO TOTAL (mg Pb/l) MERCURIO (µg Hg/l) CROMO TOTAL (mg Cr/l) CADMIO TOTAL (mg Cd/l) HIERRO TOTAL (mg Fe/l) COLIFORMES TOTALES (NMP/100 ml) COLIFORMES FECALES (NMP/100 ml) CAUDAL (m3/s)
2099 09/22/2020 12:00:00 AM LA VICTORIA 7.25 25.1 401 2.68 4.38 28.5 95 135 ... 6.48 15.2 <0,0499 NaN <0,108 <0,0299 8.86 9.30E+03 9.30E+03 NaN
721 08/18/1999 12:00:00 AM PUERTO ISAACS 7.3 22 80 3.9 4.4 15.1 24 139 ... 4.4 17.04 < 0.060 NaN < 0.200 < 0.040 2.99 >2.40E+08 9.55E+07 NaN
2081 03/18/2020 12:00:00 AM ANACARO 7.06 23 300 2.29 3.84 27.5 105 136 ... 5.82 15.5 <0,0499 NaN <0,108 <0,0299 2.92 2.40E+04 9.30E+03 NaN
543 05/12/1996 12:00:00 AM LA VICTORIA 7.4 23 90 2.6 3.6 51.2 97 163.2 ... 4.612 14.982 <0.01 NaN <0.003 <0.001 6.45 2.40E+05 2.40E+04 *
1259 04/16/2008 12:00:00 AM PUENTE HORMIGUERO 7.1 21.3 165 6.4 2.2 33.1 281 80.5 ... <2,33 15.8 <0,06 NaN <0,2 <0,04 9.73 1.10E+05 6.60E+04 NaN
112 08/22/1991 12:00:00 AM PASO DE LA BALSA 6.6 NaN NaN 6.6 4.6 15.2 8 93.2 ... 6.91 NaN 0.69 NaN 0.007 0.031 13.08 2.40E+04 2.40E+03 NaN
1122 06/22/2006 12:00:00 AM ANTES RIO TIMBA 7.54 21.8 32.6 7.38 1.45 <5,33 35 73.1 ... 2.43 10.23 <0,06 NaN <0,2 <0,04 1.18 1.50E+02 4.30E+01 NaN
525 09/04/1996 12:00:00 AM PUENTE LA VIRGINIA 6.6 23 175 3.2 9.9 20.2 186 189.9 ... 6.712 26.908 <0.01 NaN <0.003 <0.001 17.98 2.40E+06 2.40E+06 NaN
1266 04/16/2008 12:00:00 AM YOTOCO 7.05 23.1 264 3.42 2.48 22.73 374 129.2 ... <2,33 12.26 <0,06 NaN <0,2 <0,04 15.7 1.10E+06 6.60E+05 NaN
1276 07/02/2008 12:00:00 AM PASO DE LA BALSA 7.2 21 53.2 6.43 <1,937 5.95 57 60.5 ... 4.13 12.56 <0,06 NaN <0,2 NaN 2.24 9.30E+03 9.30E+03 NaN

10 rows × 23 columns

Información de los datos.¶

Se observa que a excepción de la variable 'MERCURIO (µg Hg/l)',
todas las variables son de tipo object, por lo que procederé a cambiarlas
según sea pertinente.

<class 'pandas.core.frame.DataFrame'>
RangeIndex: 2254 entries, 0 to 2253
Data columns (total 23 columns):
 #   Column                                   Non-Null Count  Dtype  
---  ------                                   --------------  -----  
 0   FECHA DE MUESTREO                        2254 non-null   object 
 1   ESTACIONES                               2254 non-null   object 
 2   pH                                       2208 non-null   object 
 3   TEMPERATURA (°C)                         1967 non-null   object 
 4   COLOR (UPC)                              1888 non-null   object 
 5   OXIGENO DISUELTO (mg O2/l)               2224 non-null   object 
 6   DEMANDA BIOQUIMICA DE OXIGENO (mg O2/l)  2231 non-null   object 
 7   DEMANDA QUIMICA DE OXIGENO (mg O2/l)     2229 non-null   object 
 8   TURBIEDAD (UNT)                          2099 non-null   object 
 9   CONDUCTIVIDAD ELÉCTRICA (µS/cm)          2197 non-null   object 
 10  SOLIDOS DISUELTOS (mg SD/l)              2191 non-null   object 
 11  NITRATOS (mg N-NO3/l)                    2194 non-null   object 
 12  FOSFATOS (mg PO4/l)                      2123 non-null   object 
 13  CLORUROS (mg Cl/l)                       2172 non-null   object 
 14  SULFATOS (mg SO4/l)                      1962 non-null   object 
 15  PLOMO TOTAL (mg Pb/l)                    1928 non-null   object 
 16  MERCURIO (µg Hg/l)                       0 non-null      float64
 17  CROMO TOTAL (mg Cr/l)                    2030 non-null   object 
 18  CADMIO TOTAL (mg Cd/l)                   1892 non-null   object 
 19  HIERRO TOTAL (mg Fe/l)                   2107 non-null   object 
 20  COLIFORMES TOTALES (NMP/100 ml)          2035 non-null   object 
 21  COLIFORMES FECALES (NMP/100 ml)          2063 non-null   object 
 22  CAUDAL (m3/s)                            228 non-null    object 
dtypes: float64(1), object(22)
memory usage: 405.1+ KB

Calidad de los datos:¶

Cambio de tipo de datos:¶

Cambio de la variable "FECHA DE MUESTREO" de tipo object a tipo DateTime:

FECHA DE MUESTREO ESTACIONES pH TEMPERATURA (°C) COLOR (UPC) OXIGENO DISUELTO (mg O2/l) DEMANDA BIOQUIMICA DE OXIGENO (mg O2/l) DEMANDA QUIMICA DE OXIGENO (mg O2/l) TURBIEDAD (UNT) CONDUCTIVIDAD ELÉCTRICA (µS/cm) ... CLORUROS (mg Cl/l) SULFATOS (mg SO4/l) PLOMO TOTAL (mg Pb/l) MERCURIO (µg Hg/l) CROMO TOTAL (mg Cr/l) CADMIO TOTAL (mg Cd/l) HIERRO TOTAL (mg Fe/l) COLIFORMES TOTALES (NMP/100 ml) COLIFORMES FECALES (NMP/100 ml) CAUDAL (m3/s)
393 1995-08-19 LA VICTORIA 7.6 22 50 3.1 5.1 27 20 188.6 ... 9 21.21 <0,01 NaN <0,003 <0,001 6.1 2.40E+04 2.40E+03 158
359 1994-10-10 PASO DE LA BOLSA 7.2 15 400 4.7 2.7 35.6 150 85.3 ... 3 33.314 <0.01 NaN <0.003 <0.001 2.06 2.4*10E4 2.4*10E4 NaN
1602 2012-11-20 PASO DE LA TORRE 6.54 24.7 97 0.899 5.89 22 101 156 ... 7.05 <5,00 * NaN * * 8.13 1.10E+07 1.50E+06 NaN

3 rows × 23 columns

Cambio de la variable "ESTACIONES" de tipo object a tipo category:

FECHA DE MUESTREO ESTACIONES pH TEMPERATURA (°C) COLOR (UPC) OXIGENO DISUELTO (mg O2/l) DEMANDA BIOQUIMICA DE OXIGENO (mg O2/l) DEMANDA QUIMICA DE OXIGENO (mg O2/l) TURBIEDAD (UNT) CONDUCTIVIDAD ELÉCTRICA (µS/cm) ... CLORUROS (mg Cl/l) SULFATOS (mg SO4/l) PLOMO TOTAL (mg Pb/l) MERCURIO (µg Hg/l) CROMO TOTAL (mg Cr/l) CADMIO TOTAL (mg Cd/l) HIERRO TOTAL (mg Fe/l) COLIFORMES TOTALES (NMP/100 ml) COLIFORMES FECALES (NMP/100 ml) CAUDAL (m3/s)
466 1995-09-15 PUERTO ISAACS 6.7 22 100 4.8 6.3 41 190 84.9 ... 3.1 8.14 <0,01 NaN <0,003 <0,001 11.5 NaN 2.40E+06 NaN
1941 2018-03-06 PUENTE HORMIGUERO 7.4 26 845 6.24 1.98 31.3 143 86.3 ... <0,112 11.5 <0,100 NaN <0,100 NaN NaN 2.00E+03 1.50E+03 NaN
413 1995-05-17 LA VICTORIA 7.8 22 75 2.2 4 4 72 166.4 ... 5 22.09 <0,01 NaN <0,003 <0,001 2.09 2.40E+04 2.40E+03 418

3 rows × 23 columns

Cambio de las variables númericas de tipo object a tipo float64:

<class 'pandas.core.frame.DataFrame'>
RangeIndex: 2254 entries, 0 to 2253
Data columns (total 23 columns):
 #   Column                                   Non-Null Count  Dtype         
---  ------                                   --------------  -----         
 0   FECHA DE MUESTREO                        2243 non-null   datetime64[ns]
 1   ESTACIONES                               2254 non-null   category      
 2   pH                                       2151 non-null   float64       
 3   TEMPERATURA (°C)                         1905 non-null   float64       
 4   COLOR (UPC)                              1849 non-null   float64       
 5   OXIGENO DISUELTO (mg O2/l)               2125 non-null   float64       
 6   DEMANDA BIOQUIMICA DE OXIGENO (mg O2/l)  2036 non-null   float64       
 7   DEMANDA QUIMICA DE OXIGENO (mg O2/l)     2019 non-null   float64       
 8   TURBIEDAD (UNT)                          2088 non-null   float64       
 9   CONDUCTIVIDAD ELÉCTRICA (µS/cm)          2162 non-null   float64       
 10  SOLIDOS DISUELTOS (mg SD/l)              2188 non-null   float64       
 11  NITRATOS (mg N-NO3/l)                    1906 non-null   float64       
 12  FOSFATOS (mg PO4/l)                      1104 non-null   float64       
 13  CLORUROS (mg Cl/l)                       2026 non-null   float64       
 14  SULFATOS (mg SO4/l)                      1881 non-null   float64       
 15  PLOMO TOTAL (mg Pb/l)                    172 non-null    float64       
 16  MERCURIO (µg Hg/l)                       0 non-null      float64       
 17  CROMO TOTAL (mg Cr/l)                    195 non-null    float64       
 18  CADMIO TOTAL (mg Cd/l)                   100 non-null    float64       
 19  HIERRO TOTAL (mg Fe/l)                   1991 non-null   float64       
 20  COLIFORMES TOTALES (NMP/100 ml)          1814 non-null   float64       
 21  COLIFORMES FECALES (NMP/100 ml)          1870 non-null   float64       
 22  CAUDAL (m3/s)                            222 non-null    float64       
dtypes: category(1), datetime64[ns](1), float64(21)
memory usage: 390.5 KB

Nota:¶

Luego de cambiar el tipo de datos de la variable "FECHA DE MUESTREO" de object a datetime, el número
de valores no nulos disminuyó de 2254 a 2243, lo que sugiere la presencia datos erróneos en la variable,
que fueron convertidos a valores nulos (NaT).

Porcentaje de Datos faltantes por variable:¶

Vemos que no existen datos para la variable "MERCURIO (µg Hg/l)" por lo que procederé a eliminarla.
Las demás variables aunque tengan datos faltantes (algunas más del 80% de datos faltantes) voy a mantenerlas.
Para un mejor análisis sería pertinente preguntar si los datos faltantes equivalen a mediciones cuyo resultado fué 0
o si simplemente no se realizaron dichas mediciones.
Para el presente análisis, asumiré que los datos faltantes son datos cuya medición no fué realizada.

Valores Nulos en la variable "FECHA DE MUESTREO"¶

FECHA DE MUESTREO ESTACIONES pH TEMPERATURA (°C) COLOR (UPC) OXIGENO DISUELTO (mg O2/l) DEMANDA BIOQUIMICA DE OXIGENO (mg O2/l) DEMANDA QUIMICA DE OXIGENO (mg O2/l) TURBIEDAD (UNT) CONDUCTIVIDAD ELÉCTRICA (µS/cm) ... CLORUROS (mg Cl/l) SULFATOS (mg SO4/l) PLOMO TOTAL (mg Pb/l) MERCURIO (µg Hg/l) CROMO TOTAL (mg Cr/l) CADMIO TOTAL (mg Cd/l) HIERRO TOTAL (mg Fe/l) COLIFORMES TOTALES (NMP/100 ml) COLIFORMES FECALES (NMP/100 ml) CAUDAL (m3/s)
63 05/12/1290 12:00:00 AM RIOFRIO 6.6 NaN NaN 3.2 2.6 156 350 150 ... 16 NaN NaN NaN NaN NaN 12.95 2.4*10E6 2.4*10E6 NaN
66 05/12/1290 12:00:00 AM MEDIACANOA 6.6 NaN NaN 2.8 3.5 60 400 130 ... 9 NaN NaN NaN NaN NaN 3.52 2.4*10E6 2.4*10E6 NaN
282 10/12/1193 12:00:00 AM ANTES RIO OVEJAS 6.3 14 50 4.4 0.6 6.4 17 104.6 ... 6.56 32.8 <0.01 NaN <0.003 <0.001 1.01 2.40E+03 2.40E+03 NaN
284 10/12/1193 12:00:00 AM PASO DE LA BALSA 6.9 15 100 7.3 0.9 67.7 91 72 ... 5.25 34.2 <0.01 NaN <0.003 <0.001 2.88 2.40E+05 2.40E+05 103
285 11/12/1193 12:00:00 AM PASO DE LA BOLSA 6.06 20.4 300 6.2 2.7 43.8 160 62 ... 3.94 56.08 <0.01 NaN <0.003 <0.001 3.66 2.40E+08 2.40E+05 213
286 11/12/1193 12:00:00 AM PUENTE HORMIGUERO 7 23 100 5.9 2.3 47.8 120 87 ... 5.25 37.62 <0.01 NaN <0.003 <0.0010 2.48 2.40E+07 2.40E+06 274
331 06/12/1194 12:00:00 AM RIOFRIO 7 16 22.5 2.4 5.6 39.4 44 163.2 ... 7.1 24.38 <0.01 NaN <0.003 <0.001 1.25 2.4*10E5 2.4*10E5 NaN
332 06/12/1194 12:00:00 AM PUENTE GUAYABAL 7 16 20 2.4 3.8 19.7 35 173.4 ... 6.7 23.25 <0.01 NaN <0.003 <0.001 2.93 2.4*10E5 2.4*10E5 NaN
333 06/12/1194 12:00:00 AM LA VICTORIA 7.5 16 22.5 3.2 2.3 23.6 47 173.4 ... 7.2 25.51 <0.01 NaN <0.003 <0.001 3.97 2.4*10E5 2.4*10E4 NaN
334 06/12/1194 12:00:00 AM ANACARO 7.9 16 22.5 2.9 1.9 74.8 36 173.4 ... 7.3 26.64 <0.01 NaN <0.003 <0.001 2.52 2.4*10E5 2.4*10E5 NaN
335 06/12/1194 12:00:00 AM PUENTE LA VIRGINIA 7.6 16 27.5 3.6 1.9 55.1 45 163.2 ... 7.2 24.38 <0.01 NaN <0.003 <0.001 1.49 2.4*10E4 2.4*10E3 NaN

11 rows × 23 columns

El error en las fechas se debe a valores registrados entre los años 1193 y 1290, lo que sugiere un posible error de tipeo. Es probable que estas fechas debieran corresponder a 1990-1993. No obstante, utilizaré estos datos únicamente para analizar la presencia de valores atípicos en otras variables. Para el resto del análisis, serán descartados.

Errores de digitación para la variable "ESTACIONES"¶

Como lo dice la descripción de los datos, son en total 19 estaciones de muestreo
por lo que se espera que en dicha variable sólo hayan 19 datos únicos.

0                    YOTOCO
1                MEDIACANOA
2          PASO DE LA TORRE
3              ANTES SUAREZ
4          ANTES RIO OVEJAS
5           ANTES RIO TIMBA
6          PASO DE LA BALSA
7          PASO DE LA BOLSA
8         PUENTE HORMIGUERO
9     ANTES INTERCEPTOR SUR
10                JUANCHITO
11        PASO DEL COMERCIO
12            PUERTO ISAACS
13                    VIJES
14                  RIOFRIO
15          PUENTE GUAYABAL
16              LA VICTORIA
17                  ANACARO
18       PUENTE LA VIRGINIA
19        PASO DE  LA BALSA
20        PASO DE  LA BOLSA
21       PUENTE  HORMIGUERO
22        ANTES INTERCEPTOR
23        PASO DE  LA TORRE
dtype: category
Categories (24, object): ['ANACARO', 'ANTES INTERCEPTOR', 'ANTES INTERCEPTOR SUR', 'ANTES RIO OVEJAS', ..., 'PUERTO ISAACS', 'RIOFRIO', 'VIJES', 'YOTOCO']

Se observa que hay un total de 24 datos únicos, por lo que procederé a realizar la limpieza de los datos.

0                    YOTOCO
1                MEDIACANOA
2          PASO DE LA TORRE
3              ANTES SUAREZ
4          ANTES RIO OVEJAS
5           ANTES RIO TIMBA
6          PASO DE LA BALSA
7          PASO DE LA BOLSA
8         PUENTE HORMIGUERO
9     ANTES INTERCEPTOR SUR
10                JUANCHITO
11        PASO DEL COMERCIO
12            PUERTO ISAACS
13                    VIJES
14                  RIOFRIO
15          PUENTE GUAYABAL
16              LA VICTORIA
17                  ANACARO
18       PUENTE LA VIRGINIA
dtype: object

Estadísticas Descriptivas:¶

Fecha:¶

min   1990-01-10
max   2023-11-10
Name: FECHA DE MUESTREO, dtype: datetime64[ns]

Variables numéricas:¶

pH TEMPERATURA (°C) COLOR (UPC) OXIGENO DISUELTO (mg O2/l) DEMANDA BIOQUIMICA DE OXIGENO (mg O2/l) DEMANDA QUIMICA DE OXIGENO (mg O2/l) TURBIEDAD (UNT) CONDUCTIVIDAD ELÉCTRICA (µS/cm) SOLIDOS DISUELTOS (mg SD/l) NITRATOS (mg N-NO3/l) FOSFATOS (mg PO4/l) CLORUROS (mg Cl/l) SULFATOS (mg SO4/l) PLOMO TOTAL (mg Pb/l) CROMO TOTAL (mg Cr/l) CADMIO TOTAL (mg Cd/l) HIERRO TOTAL (mg Fe/l) COLIFORMES TOTALES (NMP/100 ml) COLIFORMES FECALES (NMP/100 ml) CAUDAL (m3/s)
count 2151.000000 1905.000000 1849.000000 2125.000000 2036.000000 2019.000000 2088.000000 2162.000000 2188.000000 1.906000e+03 1104.000000 2026.000000 1881.000000 172.000000 195.000000 100.00000 1991.000000 1.814000e+03 1.870000e+03 2.220000e+02
mean 7.039240 21.985701 137.262125 4.092809 5.249136 29.755235 130.851624 125.183793 117.538071 1.182210e+05 0.103874 7.270358 18.671384 0.279458 0.119874 3.40100 8.124948 5.694182e+09 1.283456e+13 1.166691e+05
std 0.406411 3.633884 246.364937 2.988060 16.463874 37.510858 171.071341 107.923378 63.663964 3.630743e+06 0.628373 20.861612 17.824992 0.282435 0.163972 7.26224 15.897478 1.128802e+11 5.549967e+14 6.416359e+05
min 4.100000 0.000000 0.000000 0.000000 0.100000 1.460000 1.000000 0.000000 0.000000 0.000000e+00 0.000000 0.167000 0.000000 0.000000 0.000000 0.00000 0.005000 0.000000e+00 0.000000e+00 1.000000e+00
25% 6.800000 20.900000 39.300000 2.330000 2.047500 14.000000 30.000000 88.125000 83.000000 1.840000e-01 0.035000 4.250000 14.000000 0.010000 0.011000 0.00100 1.760000 2.400000e+04 4.850000e+03 1.560000e+02
50% 7.060000 22.400000 72.400000 3.810000 3.100000 20.600000 65.000000 118.000000 108.000000 3.685000e-01 0.070000 6.000000 17.500000 0.220000 0.057000 0.01700 3.620000 2.100000e+05 4.200000e+04 2.335000e+02
75% 7.270000 24.100000 136.000000 5.670000 4.800000 31.580000 156.400000 151.000000 136.000000 6.765750e-01 0.103000 8.247500 21.562000 0.482500 0.143500 0.04400 8.790000 2.100000e+06 2.400000e+05 4.017500e+02
max 9.700000 32.700000 2956.000000 51.500000 427.000000 706.000000 1900.000000 4259.000000 864.400000 1.500000e+08 20.100000 738.000000 696.800000 1.540000 0.997000 24.40000 186.000000 2.400000e+12 2.400000e+16 6.600000e+06

Estaciones de muestreo:¶

ESTACIÓN CONTEO PORCENTAJE
0 JUANCHITO 130 5.7675
1 MEDIACANOA 128 5.6788
2 PASO DE LA TORRE 127 5.6344
3 PUERTO ISAACS 126 5.5901
4 VIJES 125 5.5457
5 PASO DEL COMERCIO 124 5.5013
6 PUENTE HORMIGUERO 122 5.4126
7 YOTOCO 121 5.3682
8 PASO DE LA BOLSA 116 5.1464
9 ANTES RIO TIMBA 115 5.1020
10 ANTES RIO OVEJAS 115 5.1020
11 PASO DE LA BALSA 115 5.1020
12 ANTES INTERCEPTOR SUR 115 5.1020
13 ANTES SUAREZ 114 5.0577
14 PUENTE GUAYABAL 113 5.0133
15 LA VICTORIA 113 5.0133
16 RIOFRIO 112 4.9689
17 ANACARO 112 4.9689
18 PUENTE LA VIRGINIA 111 4.9246

Gráficos:¶

Tener en cuenta:
Para el análisis me apoyé de un documento técnico de la CVC sobre el tema:
Objetivos de calidad del río Cauca – Tramo Valle del Cauca: Documento técnico de soporte

Boxplots:¶

Mapa de Calor:¶

Se observa que las variables con correlaciones más fuertes son aquellas cuyo porcentaje de valores nulos es igual o superior al 90%
lo que sugiere que estas relaciones pueden estar sesgadas debido a la escasez de datos.


Oxigeno Disuelto:¶

"El oxígeno disuelto nos permite cuantificar la cantidad de oxigeno presente en el medio acuoso el cual puede ser aprovechado por los diferentes organismos, utilizado en los procesos de oxidación y demás consumos que se requieran dependiendo de la carga contaminante que transporta el cuerpo de agua, la Corporación identificó que el valor mínimo de oxígeno disuelto que se debe garantizar en un cuerpo de agua para no afectar sus dinámicas naturales ni generar alteraciones o afectaciones en los organismos que en él habitan debe ser mayor o igual a 4 mg/l."
(CVC, 2023, p. 36).

Referencia:
Corporación Autónoma Regional del Valle del Cauca (CVC). (2023).
Objetivos de calidad del río Cauca – Tramo Valle del Cauca: Documento técnico de soporte (p. 36). Dirección Técnica Ambiental.

En el reporte de la CVC se puede identificar el orden en que están ubicadas algunas de las estaciones presentes en los datos. Esta información es útil para analizar cómo evoluciona la calidad del agua a medida que el río avanza por su cauce.

image.png
Figura 1. Estaciones de monitoreo de la calidad del agua sobre el río Cauca, en jurisdicción de la CVC.
Tomado de Objetivos de calidad del río Cauca – Tramo Valle del Cauca (CVC, 2023, p. 33).


Orden de las estaciones identificadas:
1 ANTES RIO TIMBA
2 PASO DE LA BALSA
3 PASO DE LA BOLSA
4 PUENTE HORMIGUERO
5 [Estación no identificada]
6 JUANCHITO
7 PASO DEL COMERCIO
8 PUERTO ISAACS
9 PASO DE LA TORRE
10 VIJES
11 YOTOCO
12 MEDIACANOA
13 RIOFRIO
14 PUENTE GUAYABAL
15 LA VICTORIA
16 ANACARO
17 PUENTE LA VIRGINIA

En la gráfica del promedio de oxígeno disuelto a lo largo de los años (1990-2023) por estación, se observa una tendencia decreciente en sus niveles a medida que el río avanza por las estaciones de monitoreo. En la estación "Puerto Isaacs", el promedio de oxígeno disuelto cae por debajo del umbral crítico de 4 mg/L, y en "Yotoco" desciende aún más, llegando a menos de 2 mg/L. Aunque a partir de "Mediacanoa" los niveles comienzan a recuperarse, en el resto de las estaciones el oxígeno disuelto se mantiene por debajo de 4 mg O₂/L, lo que indica una condición preocupante para la calidad del agua y la vida acuática.

Nota:
Para un análisis más preciso debería identificarse la posición en la que se encuentran las estaciones "ANTES INTERCEPTOR SUR", "ANTES SUAREZ" y "ANTES RIO OVEJAS".

Evolución del OXIGENO DISUELTO (mg O2/l) a partir del año 2015 por estación:¶